智能论文笔记

Defining Cases and Variants for Object-Centric Event Data

Jan Niklas Adams , Daniel Schuster , Seth Schmitz , Günther Schuh , Wil M. P. van der Aalst

分类：人工智能

2022-08-05

流程的执行留下了信息系统中事件数据的痕迹。这些事件数据可以通过过程挖掘技术进行分析。对于传统的流程挖掘技术，必须将每个事件与一个对象（例如公司的客户）相关联。与一个对象相关的事件形成一个称为案例的事件序列。一个案例描述了通过流程进行的端到端运行。事件数据中包含的案例可用于发现过程模型，检测频繁的瓶颈或学习预测模型。但是，在现实生活中遇到的事件，例如ERP系统通常可以与多个对象关联。传统的顺序案例概念缺少这些以对象为中心的事件数据，因为这些数据显示了图形结构。一个人可能会通过使其变色将以对象为中心的事件数据迫使传统案例概念。但是，扁平化操纵数据并删除信息。因此，与传统事件日志的案例概念相似的概念对于启用以对象为中心的事件数据应用不同的过程挖掘任务是必要的。在本文中，我们介绍了以对象为中心的过程挖掘的案例概念：过程执行。这些是基于图形的案例概括，如传统过程采矿中所考虑的。此外，我们提供了提取过程执行的技术。基于这些执行，我们确定了使用图同构的属性相对于属性的等效过程行为。关于事件活动的等效过程执行是以对象为中心的变体，即传统过程挖掘中变体的概括。我们为以对象为中心的变体提供了可视化技术。贡献的可伸缩性和效率得到了广泛的评估。此外，我们提供了一个案例研究，显示了现实生活中最常见的以对象为中心的变体。

translated by 谷歌翻译

Morphology-based non-rigid registration of coronary computed tomography and intravascular images through virtual catheter path optimization

Karim Kadry , Abhishek Karmakar , Andreas Schuh , Kersten Peterson , Michiel Schaap , David Marlevi , Charles Taylor , Elazer Edelman , Farhad Nezami

分类：计算机视觉

2022-12-30

Coronary Computed Tomography Angiography (CCTA) provides information on the presence, extent, and severity of obstructive coronary artery disease. Large-scale clinical studies analyzing CCTA-derived metrics typically require ground-truth validation in the form of high-fidelity 3D intravascular imaging. However, manual rigid alignment of intravascular images to corresponding CCTA images is both time consuming and user-dependent. Moreover, intravascular modalities suffer from several non-rigid motion-induced distortions arising from distortions in the imaging catheter path. To address these issues, we here present a semi-automatic segmentation-based framework for both rigid and non-rigid matching of intravascular images to CCTA images. We formulate the problem in terms of finding the optimal \emph{virtual catheter path} that samples the CCTA data to recapitulate the coronary artery morphology found in the intravascular image. We validate our co-registration framework on a cohort of $n=40$ patients using bifurcation landmarks as ground truth for longitudinal and rotational registration. Our results indicate that our non-rigid registration significantly outperforms other co-registration approaches for luminal bifurcation alignment in both longitudinal (mean mismatch: 3.3 frames) and rotational directions (mean mismatch: 28.6 degrees). By providing a differentiable framework for automatic multi-modal intravascular data fusion, our developed co-registration modules significantly reduces the manual effort required to conduct large-scale multi-modal clinical studies while also providing a solid foundation for the development of machine learning-based co-registration approaches.

translated by 谷歌翻译

Five Properties of Specific Curiosity You Didn't Know Curious Machines Should Have

Nadia M. Ady , Roshan Shariff , Johannes Günther , Patrick M. Pilarski

分类：人工智能 | 机器学习

2022-12-01

Curiosity for machine agents has been a focus of lively research activity. The study of human and animal curiosity, particularly specific curiosity, has unearthed several properties that would offer important benefits for machine learners, but that have not yet been well-explored in machine intelligence. In this work, we conduct a comprehensive, multidisciplinary survey of the field of animal and machine curiosity. As a principal contribution of this work, we use this survey as a foundation to introduce and define what we consider to be five of the most important properties of specific curiosity: 1) directedness towards inostensible referents, 2) cessation when satisfied, 3) voluntary exposure, 4) transience, and 5) coherent long-term learning. As a second main contribution of this work, we show how these properties may be implemented together in a proof-of-concept reinforcement learning agent: we demonstrate how the properties manifest in the behaviour of this agent in a simple non-episodic grid-world environment that includes curiosity-inducing locations and induced targets of curiosity. As we would hope, our example of a computational specific curiosity agent exhibits short-term directed behaviour while updating long-term preferences to adaptively seek out curiosity-inducing situations. This work, therefore, presents a landmark synthesis and translation of specific curiosity to the domain of machine learning and reinforcement learning and provides a novel view into how specific curiosity operates and in the future might be integrated into the behaviour of goal-seeking, decision-making computational agents in complex environments.

translated by 谷歌翻译

Graph Neural Networks for Low-Energy Event Classification & Reconstruction in IceCube

R. Abbasi , M. Ackermann , J. Adams , N. Aggarwal , J. A. Aguilar , M. Ahlers , M. Ahrens , J. M. Alameddine , A. A. Alves Jr. , N. M. Amin

分类：机器学习

2022-09-07

ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列，该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战，这是由于探测器的几何形状，不均匀的散射和冰中光的吸收，并且低于100 GEV的光，每个事件产生的信号光子数量相对较少。为了应对这一挑战，可以将ICECUBE事件表示为点云图形，并将图形神经网络（GNN）作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开，对不同的中微子事件类型进行分类，并重建沉积的能量，方向和相互作用顶点。基于仿真，我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术，包括已知系统不确定性的影响。对于中微子事件分类，与当前的IceCube方法相比，GNN以固定的假阳性速率（FPR）提高了信号效率的18％。另外，GNN在固定信号效率下将FPR的降低超过8（低于半百分比）。对于能源，方向和相互作用顶点的重建，与当前最大似然技术相比，分辨率平均提高了13％-20％。当在GPU上运行时，GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件，这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。

translated by 谷歌翻译

Eight Years of Face Recognition Research: Reproducibility, Achievements and Open Issues

Tiago de Freitas Pereira , Dominic Schimdli , Yu Linghu , Xinyi Zhang , Sébastien Marcel , Manuel Günther

分类：计算机视觉

2022-08-08

自动面部识别是一个知名的研究领域。在该领域的最后三十年的深入研究中，已经提出了许多不同的面部识别算法。随着深度学习的普及及其解决各种不同问题的能力，面部识别研究人员集中精力在此范式下创建更好的模型。从2015年开始，最先进的面部识别就植根于深度学习模型。尽管有大规模和多样化的数据集可用于评估面部识别算法的性能，但许多现代数据集仅结合了影响面部识别的不同因素，例如面部姿势，遮挡，照明，面部表情和图像质量。当算法在这些数据集上产生错误时，尚不清楚哪些因素导致了此错误，因此，没有指导需要多个方向进行更多的研究。这项工作是我们以前在2014年开发的作品的后续作品，最终于2016年发表，显示了各种面部方面对面部识别算法的影响。通过将当前的最新技术与过去的最佳系统进行比较，我们证明了在强烈的遮挡下，某些类型的照明和强烈表达的面孔是深入学习算法所掌握的问题，而具有低分辨率图像的识别，极端的姿势变化和开放式识别仍然是一个开放的问题。为了证明这一点，我们使用六个不同的数据集和五种不同的面部识别算法以开源和可重现的方式运行一系列实验。我们提供了运行所有实验的源代码，这很容易扩展，因此在我们的评估中利用自己的深网只有几分钟的路程。

translated by 谷歌翻译

Visual grounding of abstract and concrete words: A response to Günther et al. (2020)

Hassan Shahmohammadi , Maria Heitmeier , Elnaz Shafaei-Bajestan , Hendrik P. A. Lensch , Harald Baayen

分类：自然语言处理

2022-06-30

当前的计算模型捕获单词的含义主要取决于文本语料库。尽管这些方法在过去几十年中取得了成功，但它们在现实世界中缺乏基础仍然是一个持续的问题。在本文中，我们专注于单词嵌入的视觉接地，并针对两个重要问题。首先，在视觉接地过程中，语言如何从视觉中受益？其次，视觉接地和抽象概念之间是否存在联系？我们通过提出一种简单而有效的方法来调查这些问题，在该方法中，语言在具体和抽象词的建模方面特别受益于视觉。我们的模型将单词嵌入与其相应的视觉表示形式对齐，而不会降低文本分布信息所捕获的知识。我们将模型应用于G \“ Unther等人（2020）报告的行为实验，该实验解决了抽象单词的视觉心理表示的合理性。我们的评估结果表明：（1）可以预测人类行为（2）与文本对应物相比，我们的接地嵌入方式在很大程度上更好地模型。（3）抽象的概念通过其与具体概念的连接而不是具有相应的视觉表现方式，从而从视觉接地中受益。

translated by 谷歌翻译

What Should I Know? Using Meta-gradient Descent for Predictive Feature Discovery in a Single Stream of Experience

Alexandra Kearney , Anna Koop , Johannes Günther , Patrick M. Pilarski

分类：机器学习 | 人工智能

2022-06-13

在计算加强学习中，越来越多的作品试图通过预测未来的感觉来构建代理人对世界的看法。关于环境观察的预测用作额外的输入功能，以实现更好的目标指导决策。这项工作中的一个公开挑战是从代理商可能做出的许多预测中决定哪些预测可能最能支持决策。在连续学习问题中，这一挑战尤其明显，在这种问题上，单一的经验可以为单一的代理使用。作为主要贡献，我们介绍了一个元梯度下降过程，代理商通过该过程学习1）要做出的预测，2）其所选预测的估计值； 3）如何使用这些估计来生成最大化未来奖励的政策 - - 全部在一个持续学习的过程中。在本手稿中，我们将表达为一般价值函数的预测考虑：对未来信号积累的时间扩展估计。我们证明，通过与环境的互动，代理可以独立选择解决部分观察性的预测，从而产生类似于专业指定的GVF的性能。通过学习，而不是手动指定这些预测，我们使代理商能够以自我监督的方式确定有用的预测，从而迈向真正的自主系统。

translated by 谷歌翻译

PaLM: Scaling Language Modeling with Pathways

Aakanksha Chowdhery , Sharan Narang , Jacob Devlin , Maarten Bosma , Gaurav Mishra , Adam Roberts , Paul Barham , Hyung Won Chung , Charles Sutton , Sebastian Gehrmann

分类：自然语言处理

2022-04-05

大型语言模型已被证明可以使用少量学习来实现各种自然语言任务的出色表现，这大大减少了将模型调整到特定应用程序所需的特定任务培训示例的数量。为了进一步了解量表对少量学习的影响，我们培训了一个5400亿个参数，密集激活的变压器语言模型，我们称之为“途径”语言模型棕榈。我们使用Pathways在6144 TPU V4芯片上训练了Palm，这是一种新的ML系统，可在多个TPU POD上进行高效的训练。我们通过在数百种语言理解和产生基准的基准方面实现最先进的学习结果来证明扩展的持续好处。在这些任务中，Palm 540B实现了突破性的表现，在一系列多步推理任务上表现出色，超过了最新的最新表现，并且在最近发布的Big Benchmark上表现优于平均人类表现。大量的大型基础任务显示出与模型量表的不连续改进，这意味着当我们扩展到最大模型时，性能急剧增加。 Palm在多语言任务和源代码生成方面也具有很强的功能，我们在各种基准测试中证明了这一点。我们还提供了有关偏见和毒性的全面分析，并研究了训练数据记忆的程度，相对于模型量表。最后，我们讨论与大语言模型有关的道德考虑，并讨论潜在的缓解策略。

translated by 谷歌翻译

A Differential Entropy Estimator for Training Neural Networks

Georg Pichler , Pierre Colombo , Malik Boudiaf , Günther Koliander , Pablo Piantanida

分类：机器学习 | (统计)机器学习

2022-02-14

共同信息（MI）已被广泛用作训练神经网络的损失正规化程序。当学习高维数据的分解或压缩表示时，这特别有效。但是，差异熵（DE）是信息的另一种基本衡量标准，在神经网络培训中尚未发现广泛使用。尽管DE提供了比MI的可能更广泛的应用程序，但现成的DE估计器要么是非可区分的，在计算上是棘手的，要么无法适应基础分布的变化。这些缺点使它们无法在神经网络培训中用作正规化器。为了解决DE先前提出的估计器中的缺点，我们在这里介绍了刀具，这是一个完全参数化的，基于DE的基于核的估计器。我们方法的灵活性还使我们能够为条件（离散变量或连续变量）以及MI构建基于刀的估计器。我们从经验上验证了高维合成数据的方法，并进一步应用它来指导神经网络的现实任务培训。我们对各种任务的实验，包括视觉域的适应性，文本公平分类和文本微调，证明了基于刀的估计的有效性。代码可以在https://github.com/g-pichler/knife上找到。

translated by 谷歌翻译

Equivariance and generalization in neural networks

Srinath Bulusu , Matteo Favoni , Andreas Ipp , David I. Müller , Daniel Schuh

分类：机器学习 | (统计)机器学习

2021-12-23

高能物理和晶格田理论的潜在对称发挥的至关重要作用要求在应用于所考虑的物理系统的神经网络架构中实施此类对称性。在这些程序中，我们专注于在网络属性之间纳入翻译成价的后果，特别是在性能和泛化方面。通过研究复杂的标量场理论，举例说明了等级网络的益处，其中检查了各种回归和分类任务。对于有意义的比较，通过系统搜索识别有前途的等效和非等效架构。结果表明，在大多数任务中，我们最好的设备架构可以明显更好地表现和概括，这不仅适用于超出培训集中所示的物理参数，还适用于不同的晶格尺寸。

translated by 谷歌翻译